如何从基因大样本中“挖矿”大数据价值?丨研报连载(三)
数字生命健康产业创新服务
基因慧
【导语】在了解基因大数据作为生命健康新基建的意义和行业背景后,本篇继续讨论基因大数据的价值链,从数据生产、数据分析、数据解读到整体解决方案的逻辑和商业模式是什么?以下《基因大数据智能生产及分析行研报告》第三部分连载呈现,欢迎留言交流。(《2021基因行业蓝皮书》开放合作中,席位即将满额)
文章 | 基因慧 编辑 | 罗湘 关键词 | 基因大数据 行研报告■ 数据生产流程
测序为例,基因数据生产流程包括从DNA/RNA采样、核酸提取、文库构建、上机测序等环节。
图:基因数据生产价值链(来源/基因慧)
从价值链分析的角度,根据承担任务的主体不同,基本活动的划分也不同。一般来说,采样是在医疗机构完成;核酸提取、文库构建和上机检测在医疗机构或者独立医学实验室(ICL)的湿实验室完成,基因检测机构参与该流程的主要方式包括与医院共建实验室或者自建独立医学实验室。
从生产分析的角度,生产的每一个环节都是基本活动;支持性活动包括生产过程中需要的人力和物力。
■ 商业模式
目前,基因数据生产环节的商业模式,以“仪器+试剂耗材”配套模式为主,同时部分试剂耗材(酶、基因捕获探针、精细化学品等)和设备(建库仪、样本和文库质控设备等)独立销售。从长期来看,常规检测流程所需设备和配套试剂耗材集成一体化和自动化将成为趋势,但特殊流程和场景下仍需要试剂耗材和设备的补充。
从业务形式来说,生物信息分析的基本活动是通过对下机数据的处理和分析得到检测结果,该活动的基础设施包括数据计算、存储、管理所需的信息基础设施和基于特定的分析需求而实现完整功能的算法代码包或软件。
测序通量的提升带来的基因数据增量,同时提高了数据存储和管理的需求;不同分析阶段生成的基因数据价值不同,提高了数据治理场景的复杂度。
面对巨量新增基因数据在生信分析、数据存储和数据治理等方面的需求,传统的解决方案在成本和效率方面已经无法满足。云计算、人工智能、5G、区块链等技术的发展正或即将解决基因数据的高性能存储计算、数据挖掘、传输、可控共享等方面的需求。
图:生信分析价值链(来源/基因慧)
面对大规模基因数据处理以及转化应用场景的需求,目前围绕生物信息分析的布局主要有三种方式,包括生物信息软件开发、基因大数据平台解决方案、软硬件加速/数据加密/高速传输等增值服务。
数据解读是连接基因数据生产与医学科研及临床的重要环节,通过结合基因组数据与表型数据,挖掘基因与表型、疾病之间的关系,从而指导临床决策和科研发现。
如何从海量的基因突变信息中,寻找有用的突变信息,涉及到对基因数据的解读。随着测序生产成本和生物信息基于云计算平台的分析成本越来越低,基因数据解读在基因检测服务中的成本比例将逐渐提高。
在科研上,采用一定的科研素材和数据挖掘算法来分析和解读基因数据,有助于发现新的致病基因或者新疾病。在临床上,采用临床级的分析算法和相应的应用工具来分析和解读基因数据,有助于实现精准诊断。临床级分析算法,是在对基因数据的基本分子生物学注释的基础上,对每一个变异给予致病性分级的分析。
图:NGS测序服务成本构成(来源/Frost&Sullivan)
根据Frost&Sullivan的NGS测序服务成本构成数据,从2012年到2020年,在超摩尔定律下测序仪在整个测序服务的成本占比下降了83.3%,而数据解读成本占比翻了一倍,占整体成本的30%(见上图)。
基因慧认为遗传咨询及数据解读是细分领域的蓝海市场,且商业化价值高。但其服务体系的标准化建立、数据积累与共享局限性以及目前我国专业遗传咨询师人才奇缺,导致其商业化周期较长。遗传咨询服务需要跨学科合作,该领域的产品将结合临床医生、遗传咨询师经验、数据库及数字技术形成“人机互动”平台。
交付周期和交付质量是基因大数据生产与分析的两个关键业务指标。
目前市场上的多数产品都是基因数据生产、分析与管理业务分离的状态,例如自购测序仪完成测序后,将数据上传至自由分析平台或者委托给第三方进行分析,环节繁琐造成交付周期较长。另外,在传统产线中人工协作、人机半自动化 以及“人治”的数据管理方式,因为不一致性、污染、操作误差等因素的影响,对数据质控无法完全保证。
业务流程的复杂化、基因数据的增量规模以及行业的竞争加剧,致使下游用户对于测序数据的产量、质量及服务的需求持续提升。随着生物技术和数字化技术的发展,目前基因行业内企业正采用数字化和自动化的技术来实现智能化的生产系统,实现多环节或全流程的一站式全自动调度。
一站式解决方案主要有三个核心特点:自动化、智能化和一站式。
其中,一站式解决方案把样品制备、文库制备、测序、生信分析、报告发放等原本分离的流程整合起来,实现全流程的解决方案或者系统。随着信息化、数字化、物联网等技术的发展,越来越多企业在开发智能化的一站式服务系统,让服务流程在该系统自动化流转,形成了实时调度、自动检测、智能决策的全套流程。
推荐阅读月
为什么说基因大数据是生命健康新基建《2021基因行业蓝皮书》招商合作进行中
【声明】为传播科学信息,推动基因及数字生命健康产学研连接,我们秉持中立、专业、赋能的理念收集、分析或发布信息。但由于时效性及行业特殊性,所刊登内容仅供研究参考,不作为决策依据;本文相关信息不代表基因慧机构的观点;“基因慧”刊登的原创内容的知识产权为“基因慧”商标拥有者及相关权利人所有;欢迎转载,转载请申请并注明来源。欢迎个人及机构投稿及合作。
关于基因慧
基因慧是数字生命健康领域创新服务平台。团队深耕行业十余年,从行研咨询、媒体资讯、产业数据库等方面提供优质内容服务。基因慧作为国发改产业研究合作单位,联合多家专业机构发布了多份基因及数字生命健康领域行研报告,参与组织发布了两份行业共识和一项团体标准,致力于建设产业信息大数据平台,服务生命科技创新创业。
☆ 发布产业大数据平台优脉通YourMap
☆ 中国遗传学会生物产业促进委员会委员
☆ 发布数十份基因及数字生命健康领域行研报告
☆ 主办数字健康私董会、大湾区生命健康创新论坛
☆ 广东省精准医学应用学会政策研究应用分会常务委员
▼ 点击“阅读原文”,申请电子版基因大数据报告